数字茶业:基于机器视觉的茶叶理条质量评价方法
江南体育软件下载 首页 个人中心
下载APP 下载APP
手机访问 手机端二维码
一头大象-江南体育下载平台注册

数字茶业:基于机器视觉的茶叶理条质量评价方法

槽式杀青理条机是兼具杀青和理条功能的茶叶炒制机械,适用于针形茶和扁形茶,也是茶叶初加工阶段的常用设备。槽式杀青理条机的工作原理是通过茶叶在槽锅中往复运动,并对锅槽进行传导加热,使茶叶快速失水做形,达到干茶炒制的要求。由于茶叶在槽式杀青理条机中作用时间短、变化快,当锅温和往复频率不符合茶鲜叶的理条要求时,就会造成过度理条或理条不足的情况。

近年来,智能技术已在茶叶理条工序中有所应用,曹成茂等和傅杰等通过双模糊控制算法实现了自动对理条参数的工艺调节,减少了制茶过程中的人为因素干扰,王小勇等通过人工神经网络程序得出理条温度93 ℃,理条时间5 min,投叶量为1.0 kg,为最佳工艺组合,刘青和尹凌鹏通过基于PLC的逻辑控制器的控制程序实现了理条机的自动化改进。而在机器视觉技术和预测模型的运用方面,陈念等和陈荣等都通过SVM支持向量机算法分别对茶叶品质和茶叶病虫害监测方面进行预测分析,精确度均达到了90%以上,刘自强等通过机器视觉技术对茶叶颜色和形状进行提取识别,来实现茶树品种的分类。

文章基于机器视觉与图像处理技术,提出了一套对茶叶理条作业效果的检测系统,通过采集不同理条程度的茶样图像,获取其外观形态、颜色特征和纹理特征,再通过基于Python3.6环境中开发的决策树、随机森林和支持向量机三种算法进行模型训练,最终实现对不同样本的理条程度预测。采用机器视觉技术对茶叶在杀青理条作业过程中进行取样分析,判断茶叶的形态效果是否达到预期程度,能够避免茶叶欠理条或过理条,提高茶叶加工效率。

01

材料与方法

实验选择由安徽农业大学自主选育并栽培的农抗早品种进行理条,实验用样本均是在正常室外环境下生长的长度为3~5 cm的一芽一叶样本,采摘时间为2022年7月上旬,这一环境下生长的茶叶样本含水量适中,叶片较大,叶形舒展,适合对比不同理条程度下茶样的形态变化,便于特征参数读取和分析。

1、样本处理

理条是针形茶和扁形茶加工过程中的重要工艺,通过加热失水和外力作用使茶叶均匀塑造成形,常用的理条机是通过电热丝加热和高频次的左右移动代替锅温加热和手工外力作用,在茶叶加工领域有很广泛的应用。

实验采用浙江君来茶叶机械有限公司生产的6CMD40/3型茶叶理条机,在锅槽温度150 ℃、振动频率150次/min的条件下进行理条作业;将采摘的农抗早茶叶样本分为三组(每组200个样本),分别在同一个锅槽中理条作业2 min(理条时间不足)、4 min(理条时间适宜)、6 min(理条时间过长),制得三组不同理条程度的茶样。分别收集并迅速进行拍照取样,以防止茶叶受潮吸水影响作业效果。

2、图像采集及处理

采用Basler相机在图1所示的实验平台上进行图像采集,后将各个理条程度的样本图像,通过图像处理程序经过灰度化处理、二值化处理、形态学处理、区域分割的处理方法完成对茶叶样本图像的预处理过程,使图像中的各个茶叶样本可以实现参数提取流程。

3、构建特征提取算法

预处理工序完成之后的图像效果如图2所示,根据预处理后的图像提取外观物理特征信息,采用区域边界内的每个像素点之间的距离来计算长度,连通域中的实际像素点个数为面积,叶片椭圆主轴为长轴,次轴为短轴进行参数计算,共读取9个形态特征参数(直径D、矩形度R、圆形度E、对角线长L、最小外接矩形的长轴Ls、最小外接矩形的短轴S、边界周长C、细长度T、紧凑度J)。

茶叶样本在理条环节中处于一个不断失水的状态,其色泽、纹理特征也在不断发生变化。图像处理的常用颜色空间有RGB、HSV、HSI等。不同颜色空间特征参数有不同的描述效果,本系统选择采集RGB图像,并通过程序处理获得HSV颜色空间的特征参数,获取各个颜色特征的一阶矩(Mean)、二阶矩(Variance)和三阶矩(Skewness)来表示茶叶样本的颜色特征,其中C1、C2和C3分别代表红色、绿色、蓝色平面内的一阶矩;C4、C5和C6分别代表三个颜色平面内的二阶矩;C7、C8和C9分别代表三个颜色平面内的三阶矩;C10、C11和C12分别代表色调、饱和度和明亮度的一阶矩;C13、C14和C15分别代表色调、饱和度和明亮度的二阶矩;C16、C17和C18分别代表色调、饱和度和明亮度的三阶矩。共读取18个颜色特征参数。

茶叶的纹理特性随着叶片在槽锅中的不断运动和高温失水的作用下会不断变化,系统通过将图像信息输入至灰度-梯度共生矩阵(GGCM)中,使其能够读取茶叶样本图像的纹理基元和排列信息,计算了小梯度优势T1、大梯度优势T2、灰度分布不均匀性T3、梯度分布不均匀性T4、能量T5、灰度T6、梯度T7、灰度均方差T8、梯度均方差T9、相关度T10、灰度熵T11、梯度熵T12、混合熵T13、惯性度T14和逆差矩T15,共计15个纹理特征参数。

总计42个外观特征参数,能够完整描述茶叶在各个理条作业程度下的效果。

4、多数据模型测试

为了实现在理条阶段的茶叶理条作业品质的准确分析,实验采用了三种不同数据模型算法对茶叶样本参数进行分析处理,并对比各个预测模型的品质预测准确度,为茶叶理条作业的品质分析选择出最合适的数据分析模型。

决策树模型是根据识别出的茶叶参数数据集中不同理条作业程度的参数差异划定区域,创立分支,当参数的数据种类越多、决策树分支越多,所能达到的分类效果和预测准确度就越高;随机森林算法是在决策树算法的基础上演变出来的,通过多棵决策树并组和形成随机森林,利用多个决策树模型共同作用进行参数的分类、预测、决策等工作,本质是对决策树算法的一种改进;支持向量机算法(SVM)可将识别到的参数以坐标点的形式广泛分布于坐标系中,再在坐标系中通过“超平面”的划定区分不同参数范围,以此实现了对不同参数分类预测的目的。

02

结果与分析

1、理条实验

选择并采摘600个于同一区域生长、梗尖长度统一、含水量适中的农抗早一芽一叶样本,200个样本为一组,共分为三组,三组样本分别在槽式杀青理条机的同一锅槽中进行2、4、6 min的理条作业,然后以20个样本为一组放入实验台上分别进行样本图像采集,实验所用的理条机和图像采集平台如图3所示。

2、数据集建立

将所采集的样本图像分类保存并完成图像预处理并对比效果如图4所示,使其便于识别参数,用外观特征提取算法进行批量读取,并建立特征数据集。

特征数据集建立完成后,将三种理条作业程度的茶叶样本外观特性参数按照形态特征、颜色特征和纹理特征划分开来,计算其平均值整理如表1~表3所示,简要分析后发现三类特征参数随着理条作业时间的变化大多均呈递增或递减,其中形态特征参数的趋势变化符合程度为88.9%,颜色特征参数的趋势变化符合程度为94.4%,纹理特征参数的趋势变化符合程度为86.7%,表明通过颜色特征参数评判区分理条作业效果最为准确。

3、特征参数显著性分析

将读取的茶叶样本数据通过决策树模型处理得到决策树可视化图像,前4级的决策树分支均是通过颜色特征参数的划分形成多级分支,分别为C14(饱和度二阶矩)、C8(绿色平面的三阶矩)、C9(蓝色平面的三阶矩)、C7(红色平面的三阶矩)、C3(蓝色平面的一阶矩)、C16(色调三阶矩)、C5(绿色平面的二阶矩)、C10(色调一阶矩)、C1(红色平面的一阶矩)。

将读取到的三个理条加工时段茶叶特征参数用显著性分析模型进行读取,进一步验证颜色特征参数是否是评判茶叶理条作业样本品质的最显著的特征。将42个外观特征参数进行显著性分析排序,比较每个参数在分类模型中所占的权重,最终得到如图6所示的显著性分析图表,实验发现42个特征参数中在分类模型中所占权重最高的均是颜色特征参数,分别是C17(饱和度三阶矩)、C15(明亮度二阶矩)、C10(色调一阶矩)、C4(红色平面内的二阶矩)、C14(饱和度二阶矩)、C13(色调二阶矩)、C18(明亮度三阶矩)、C7(红色平面内的三阶矩)、C9(蓝色平面内的三阶矩)、C16(色调三阶矩)。

通过上述实验说明外观颜色特征中是茶叶理条环节中变化最为显著且最易于对理条效果进行分类的物理特征。

4、算法测试结果

分别将建立所得的特征数据集输入至决策树、随机森林、支持向量机三种训练模型中,分别将数据集样本按照训练集与测试集的比例为9∶1和8∶2输出理条作业效果分类的准确度,比较不同数据模型的分类效果。

选择9个形态特征参数、18个颜色特征参数、15个纹理特征参数建立样本数据集,在决策树、随机森林、支持向量机三种算法模型下的准确度指标如表4所示。

实验结果表明,3种不同分类算法的分类测试准确度均达到了90%左右,其中决策树算法的分类准确度达到了100%,这是因为决策树算法在样本数量较少且参数种类多的情况下衍生出了多级分支,因此达到了较好的分类效果。而大量数据集下的分类算法中支持向量机算法的准确度显著高于随机森林算法。同时实验比较了训练集与测试集的比例为9∶1和8∶2时对分类准确度的影响,最终结果表明9∶1的训练、测试比例更好。

03

讨论

文章基于机器视觉技术和数据模型构建,建立了一种针对茶叶理条环节作业效果快速识别并分析的方法,验证了决策树、随机森林和支持向量机三种分类算法在农抗早样本数据集的处理分析准确性上的分析效果,最终的结果表明:

(1)机器视觉技术可以精确识别茶叶在理条环节中的形态变化、颜色变化和纹理变化,并且读取出的参数种类越多,对数据模型的分类准确度的帮助越大,其中颜色特征参数是三类外观特征参数中变化最为显著的特征参数。

(2)三种算法模型中,决策树模型的分类效果达到了100%,这是因为样本数据量少,同时参数种类多,使得决策树分支众多,得以实现少量数据下的高精确度分类。而大量数据下支持向量机算法的分类准确度显著高于随机森林算法,而随着数据集的进一步扩大支持向量机算法的优势会更显著。

(3)该方法也可以用于不同类型的茶叶在不同加工流程中的作业效果分析,文章采用了一芽一叶的农抗早品种在理条环节的作业分析,而针对实际情况可以运用到更多不同的加工环节中去。

来源:中国茶叶加工

如涉及版权问题请联系删除

Baidu
map